Análisis del Género Discursivo Aplicado a la Clasificación Automática de la Polaridad en Comentarios sobre Productos

نویسنده

  • John Roberto Rodríguez
چکیده

This thesis is about polarity analysis of reviews, that is, classifying reviews as either positive or negative based on linguistic evidence. I describe a genre-based approach for the polarity analysis of customer reviews. Genre is characterized by a schematic structure of the discourse composed of different types of stages, each one with a goal-oriented function. This approach to polarity analysis, first, distinguishes stages in the genre of reviews and, subsequently, evaluates the usefulness of each type of stage in the determination of the polarity of the entire review. The thesis is broadly divided into two parts. In the first part, I characterize customer reviews as a discursive genre by analyzing both their structure and their linguistic register. Based on these analysis, I postulate that customer reviews are composed of three main types of stages: valorative, narrative and descriptive. In the second part of the thesis, I determine the usefulness of the different type of stages for the classification of positive and negative reviews. The rationale behind our approach is the assumption that within the specific genre of customer reviews, not all parts of a text contribute equally to expressing the underlying sentiment. In order to validate this hypothesis, I evaluate three alternative methods used to automatically detect and determine the usefulness of each type of stage in the detection of the polarity of the entire review. The first method applies lexical and morphosyntactic information to identify the type of stage that best expresses the polarity of the whole review. The second method analyzes the role played by narrative chains in determining the polarity of reviews. The third method is based on the measurement of syntactic complexity to detect and remove descriptive sentences with the opposite polarity to that of the entire document (asymmetric sentences) as a previous step to identify positive and negative reviews. The main conclusion that has been drawn is that there is a relationship between the types of stages and the polarity expressed in the review: users often employ stages differently according to whether its polarity is positive or negative. These differences in use of stages leads me to the conclusion that there are two (sub)genres, rather than one, for the expression of opinions on the Web: the (sub)genre of positive reviews and the (sub)genre of negative reviews.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Análisis de sentimientos multilingüe en la Web 2.0

Nuestra propuesta consiste en un sistema de análisis de sentimientos h́ıbrido, que consiste una aproximación h́ıbrida, ya que utiliza un léxico de palabras etiquetadas según su polaridad, además de aprendizaje automático. El léxico se genera de manera automática a partir de un corpus etiquetado, y se asigna a cada término del texto una puntuación para cada polaridad. El aprendizaje automático se ...

متن کامل

Clasificación de Música por Género Utilizando Redes Neuronales Artificiales

Resumen — En este proyecto se realiza un estudio de la información contenida en archivos digitales de música con el fin de determinar parámetros representativos de un género musical para ser usados como entradas a un sistema clasificador implementado con Redes Neuronales Artificiales. La extracción de parámetros se realiza haciendo uso de análisis en el dominio del tiempo, de la frecuencia, y u...

متن کامل

Análisis del desempeño del algoritmo genético en la clasificación automática de documentos

Resumen. Existen diversos algoritmos de clasificación para el proceso de clasificación automática de documentos, estos algoritmos buscan soluciones eficientes y rápidas, es por lo cual, el Algoritmo Genético es ideal para aplicar a este contexto, ya que es capaz de encontrar soluciones eficientes en unos cuantos segundos, por su capacidad de examinar el espacio de búsqueda en forma amplia y efi...

متن کامل

Análisis Difuso de Imágenes a Color de Productos Agrícolas

Resumen. Este artículo presenta un método de aproximación difuso para analizar la calidad de las frutas en la Zona Central de Chile sobre la base de las imágenes en color de estas frutas. Las imágenes están tomadas al principio de la cinta transportadora en un proceso automatizado de variedad (para los envases). Las imágenes se procesan para obtener información cuantitativa preliminar sobre la ...

متن کامل

Sistema para el análisis automático de modelos de navegación en

Conocer de antemano la estrategia de navegación adoptada por los usuarios de un producto hipermedia es una pieza clave en el proceso de desarrollo de calidad de estos productos, ya que la mencionada estrategia de navegación determina como los usuarios accederán a la información contenida en la base de conocimiento y por ende, cómo esta información será percibida. La adaptación de las pruebas de...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 56  شماره 

صفحات  -

تاریخ انتشار 2016